相信會想來加入Google開的這系列課程,不是已經是公司內部的資料分析者就是希望能夠學習資料分析的人。
前面已經提到塑造問題的重要,而在本Specialization的第二門課,Google的專家就給出了簡要的問題分類。
一般在學術(學校體系)對於目前機器學習可解決問題範疇的分類,很大一部份可以用這張圖做良好的區分。
其中,Regression及Classification因為有資料標註,又可以稱為監督式學習(supervised learning)。
而沒有標註的部分,可稱作非監督式學習(unsupervised learning)。
但有時候我們對於標註的定義並非相當清晰,又或是數量上有標註與無標註的比例相差懸殊,又有一種介於兩者間的學習,就稱為半監督式學習(semi-supervised learning)。
這絕對是個大哉問!
而課程中給了一個有趣的分布圖如下:
問題的答案給的是適合分類及回歸問題。
我想,這個答案更接近你的觀察有多細微,就有多少問題可能的變化。
當然啦,數據這種東西,看多了感覺就來了;有心動的感覺,故事跟可能的商業模式就來了。